Chi Nef) Fife s | 4% 


第 64 卷 第 21 期 2020 11 月 


弱 引 文 关系 视角 下 跨 学 科 相 关 知识 组 合 识 别 方法 探讨 ” 
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摘 要 : [目的 /意义 ] 科 学 系统 的 复杂 化 ,使 跨 学 科 合 作成 为 现代 科学 创新 研究 的 重要 范式 和 必然 趋势 。 识 别 具 有 高 度 合 
作 潜 力 的 跨 学 科 相 关 知 识 组 合 , 成 为 促进 跨 学 科 科研 合作 创新 的 关键 。 [ 方法 “过程 ] 首 先 ,选择 目标 学 科 源 文献 
及 其 跨 学 科 参 考 文献 、 跨 学 科 引 证 文献 ,构建 基于 关键 词 的 跨 学 科 知 识 弱 引文 关联 网 络 ;其 次 ,划分 知识 媒介 上 b 的 
类 型 ,并 识别 目标 学 科 知 识 节点 a- 知识 媒介 b - 跨 学 科 相 关 知 识 c 的 弱 关系 结构 ;最 后 ,定义 目标 学 科 知识 节 点 
影响 力 指数 Aj、 知 识 媒 介 影 响 力 指数 Bi、 跨 学 科 知识 相 关 性 指数 C1、 跨 学 科 知 识 组 合 ac 潜在 合作 指数 了 ,识别 合 
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学 科 是 人 类 对 知识 的 系统 归 类 。 科 学 系统 的 逐 浙 
复 贺 化 ,致使 诸多 社会 问题 和 科学 研究 都 无 法 依靠 音 
一 沉 科 知识 解决 ,打破 学 科 界限 的 科学 知识 交流 与 合 
作 竹 益 频 繁 , 跨 学 科研 究 成 为 现代 科学 创新 发 展 不 可 
或 候 的 模式 ") 。 在 此 背景 下 ,为 解决 本 学 科研 究 难题 、 
突 裤 科 研 瓶 颈 或 实现 科研 创新 ,需要 不 断 获取 并 动态 
引入 其 他 学 科 的 相关 概念 .理论 .方法 和 技术 等 ,进行 
跨 学 科 合 作 研究 。 然 而 在 实际 工作 中 ,研究 者 一 般 对 
本 学 科 知识 相对 了 解 ,对 哪些 跨 学 科 知识 可 以 进行 合 
作 研 究 ,没有 基本 的 把 握 。 因 此 , 跨 学 科 相 关 知 识 组 合 
的 识别 ,成 为 跨 学 科 合作 研究 的 关键 。 

“$j A" (strength of weak ties) 起 源 于 社会 学 研 
究 领域 ,释义 为 两 个 行动 者 之 间 的 短暂 社会 接触 中 。 
其 提出 者 M，Granovetter 教授 中 指出 强 关 系 使 组 织 
部 联系 密切 且 稳定 ,而 弱 关系 则 为 不 同 群体 组 织 之 间 
的 信息 交流 提供 了 重要 途径 ,使 相互 孤立 的 各 子 群 之 


S 作 潜力 值 高 的 跨 学 科 相 关 知 识 组 合 。[ 结果 /结论 ] 选 择 情 报 学 领域 9 种 CSSCI 期 刊 2015 -2019 年 的 载 文 及 其 跨 学 
CO 科 参 考 与 引证 文献 为 样本 进行 实证 研究 ,验证 基于 弱 引 文 关系 的 跨 学 科 相 关 知 识 组 合 发 现 方法 的 有 效 性 与 可 行 性 ， 
= 并 识别 得 到 “科研 合作 ”-“ 知识 流 动 ”-“ 种 群 动力 学 模型 ”等 情报 学 科 的 高 合作 潜力 的 跨 学 科 相关 知识 组 合 。 
RE: BAA ”引文 分 析 abc HAR 跨 学 科 相 关 知 识 组 合 ”潜在 合作 指数 P 
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间 开 始 建立 联系 ,并 且 伴 随 这 种 弱 联系 的 不 断 加 强 ,不 
同 信息 交流 的 范围 进一步 扩大 ,加速 了 信息 的 传播 . 融 
合 发展 及 创新 。 随 后 学 者 JP. Onnela 4" E. Bak- 
shy 等 ” J. Zhao 等”.E. David 等 “同样 在 研究 中 论 
述 了 这 一 观点 。S. K. Genius 研究 结果 表明 :与 强 连 
接 关系 相 比 , 弱 关 系 能 传递 更 多 潜在 的 、 多 样 化 的 、 非 
宛 余 的 知识 资源 。A，Abbasi 4] M. Bettoni 等 ”1 L. 
Y. Yang 等 "| 发现 弱 连 接 关系 更 易 使 个 体 与 知识 网 络 
中 其 他 子 网 中 的 个 体 建 立 更 为 广泛 的 关联 关系 ,对 促 
进 科研 合作 具有 积极 作用 。 

目前 ,在 科学 计量 学 领域 有 学 者 用 共 词 网 络 中 的 
弱 关 系 进行 相关 研究 。 陷 玲 等 '" 基于 弱 关 系 理论 构 
建 高 频 词 弱 共 现 网 络 , 根 据 主题 之 间 弱 连接 的 特点 分 
析 学 科 交 叉 的 模式 ,探讨 情报 学 学 科 微 观 层面 的 交叉 
HE, PRES) 、 刘 小 慧 等 扩 利用 开放 式 、 闭 合式 的 
非 相 关 知 识 发 现 方法 ,识别 情报 学 与 计算 机 科学 领域 
的 潜在 跨 学 科 合 作 研 究 主题 。 但 M. Song 等 ' 对比 发 
现 ,引文 比 共 现 能 识别 数量 更 多 的 关系 配对 , 且 配 对 关 
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系 更 具 独 特性 和 多 样 性 。 

引文 是 有 效 揭示 不 同学 科 之 间 知 识 扩散 、 关 联 与 
演化 路 径 最 为 直接 的 表达 ,有 效 促进 了 跨 学 科 知 识 的 
协同 ,交叉 、 融 合 发 展 与 创新 "5 。 因 此 , 跨 学 科 引 文 
分 析 是 跨 学 科 知 识 流 动 的 有 效 识别 工具 ""。 引 文 网 
络 中 存在 知识 的 弱 关联 ,根据 弱 关 系 的 定义 ,可 以 分 为 
以 下 几 种 类 型 :@ 低 阔 值 关系 节点 。 网 络 中 节点 关系 
BERTHE .与 强 关系 对 立 的 一 类 关系 连接 为 弱 关 
系 "。 例 如 源 文献 与 其 参考 或 引证 文献 形成 的 引文 
知识 网 络 中 连接 强度 较 小 的 节点 关系 。@@ 子 网 间 关 系 
节点 。 不 同 子 网 间 节 点 联系 相对 稀疏 , 则 为 弱 关 
系 ""。 例 如 跨 学 科 引 用 /被 引用 网 络 中 不 同学 科 知 识 


弱 关 系 引用 网 络 ,用 于 识别 跨 学 科 相 关 知 识 。 

在 引文 网 络 的 低 国 值 子 网 间 间接 联系 3 种 弱 关 
系 中 ,没有 直接 联系 的 子 网 间 的 间接 关系 节点 ,更 具有 
潜在 合作 价值 ,也 更 适合 于 跨 学 科 相关 知识 发 现 “。 
因此 ,本 文 提取 学 科 源 文献 关键 词 及 其 跨 学 科 参 考 文 
献 关 键 词 . 其 跨 学 科 引 证 文献 关键 词 ,构建 跨 学 科 知 识 
关联 网 络 , 在 子 网 间 识 别 间接 联系 知识 方 点 ,作为 弱 关 
系 关联 数据 ,探讨 跨 学 科 相 关 知识 组 合 的 发 现 方法 ;并 
以 情报 学 为 例 进行 实证 研究 ,以 期 为 该 学 科 未 来 开展 
跨 学 科 合 作 研 究 , 进 行 有 针对 性 的 科研 创新 ,提供 重要 
的 决策 参考 。 


2 研究 步骤 与 方法 


之 间 的 引用 /被 引用 关系 节点 。@ 间 接 联 系 关系 节点 。 
通过 其 他 节点 建立 间接 联系 的 非 相 关 知识 ,具有 弱 关 
系 之 例如 共 引 或 共 被 引 关系 节点 ,或 有 较 好 的 引用 关 
系 全 没有 共 现 关系 的 知识 节点 。 目 前 很 少 有 学 者 利用 
民 网 络 中 存在 的 弱 关 系 进行 知识 挖 据 、 发 现 的 研究 ， 
翅 有 涉及 跨 学 科 的 研究 , 杜 德 慧 等 "” 以 情报 学 科 源 
文献 关键 词 - 跨 学 科 参 考 文献 关键 词 作为 关联 数据 ， 


本 文 基于 路 学 科 子 网 间 间接 联系 知识 节点 的 弱 
引文 关系 ,识别 跨 学 科 相 关 知 识 组 合 。 步 又 分 为 以 下 
3 个 阶段 :中 构建 跨 学 科 知 识 引 用 /被 引用 弱 关 联网 
络 ;@ 识 别 跨 学 科 引 文 网 络 中 的 目标 学 科 知 识 节 点 a 
-知识 媒介 b - 跨 学 科 知 识 e 的 弱 关 系 结构 ;@ 构 建 跨 
学 科 相关 知 识 组 合 a-c 评价 识别 模型 。 具 体 步 又 与 方 
法 如 图 1 所 示 : 
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构建 基于 关键 词 的 获取 目标 学 科 核 心 期 刊 文献 及 其 跨 学 科 参 考 文献 、 跨 学 科 引 证 文献 ; 
跨 学 科 知识 引用 /| 改 | 提取 文献 核心 关键 词 ; 
被 引用 弱 关 联网 络 将 文献 引文 关系 转化 为 所 含 关键 词 的 引用 /被 引用 关系 ; 
~ 构建 基于 关键 词 的 跨 学 科 知识 引用 /被 引用 弱 关联 网 络 
[I H 5 
Se | | 知识 媒介 b | | 提取 学 科 交 叉 关键 词 ; | 
© | | 类 型 划分 “| | 根据 知识 流向 划分 “ 流 人 型 ”“ 流 出 型 ”“ 流 动 型 "| i 
= | 三 种 类 型 的 知识 媒介 
am 识别 a-b-e BRR el i 
i= | | 基于 不 同 知识 媒介 | 基于 不 同 知识 媒介 类 型 的 知识 流动 路 径 分 析 ;| ; 


| | 知识 流动 路 从 识别 | | 识别 网 络 中 所 有 a-b-e 弱 关 系 结构 


| | laeua abo 弱 关 系 | | 得 到 7 种 流动 形式 的 弱 关 系 路 径 ， 


定义 目标 学 科 知 识 节 点 影响 力 指数 A、 知 识 媒介 影响 力 指数 B、 


构建 评价 模型 识别 
跨 学 科 相 关 知 识 组 合 


跨 学 科 知 识 相关 性 指数 Cry 


构建 跨 学 科 知识 组 合 a-c 潜在 合作 指数 P; 


识别 合作 潜力 值 高 的 跨 学 科 相 关 知识 组 合 


1 研究 框架 


2.1 构建 跨 学 科 知 识 引 用 /被 引用 弱 关 联网 络 

所 研究 学 科 , 即 目标 学 科 。 目 标 学 科 源 文献 的 参 
考 与 引证 文献 ,一 部 分 来 源 于 目标 学 科 , 即 本 学 科 ; 男 
一 部 分 来 源 于 非 目 标 学 科 , 即 跨 学 科 。 知 识 以 文献 作 
为 载体 ,通过 文献 间 的 引用 与 被 引用 实现 不 同学 科 知 
识 流动 与 融合 ,构成 知识 动态 交流 与 关联 网 络 ” 。 这 
一 网 络 是 由 若干 强 连接 关系 和 弱 连 接 关 系 构成 的 交互 
网 络 “ 。 其 中 , 目标 学 科 文 献 之 间 基 于 引用 与 被 引用 
产生 的 多 为 内 部 知识 交流 ,知识 关联 密切 、 共 享 性 强 ， 


能 够 进行 深层 次 交流 ,属于 强 关系 连接 ;而 跨 学 科 参 
考 /引证 文献 与 目标 学 科 知识 的 交流 频次 少 , 且 关 联 程 
度 低 , 则 为 弱 连 接 关系 。 利 用 目标 学 科 与 跨 学 科 关键 
词 构建 引文 知识 关联 网 络 G, 见 图 2。 
2.2 识别 跨 学 科 引 文 网 络 中 的 a-b-e BX RAY 

弱 关 系 理论 指出 ,在 社交 网 络 中 , 若 a 和 c 有 一 个 
共同 的 朋友 ,那么 a 和 c 成 为 朋友 的 概率 会 增加 ,从 
而 建立 某 种 联系 ” 。 同 样 在 跨 学 科 知 识 引文 网 络 中 也 
适用 该 原理 , 见 图 3。 
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本 学 科 参 考 文献 关键 词 


知识 流入 


跨 学 科 参 考 文献 关键 词 


li | 


目标 学 科 文 献 
关键 词 


知识 流出 


跨 学 科 引 证 文献 关键 词 


2 基于 关键 词 的 跨 学 科 知 识 弱 引文 关联 网 络 构建 


r-----------------------------------------------------------------------， 


目标 学 科 知 识 节 点 a | 跨 学 科 相 关 知 识 c 


i 交叉 
= 知识 媒介 


图 3 a-b-c 弱 关 系 结构 


< 二 目标 学 科 知 识 节点 a 与 跨 学 科 相关 知识 ,通过 知 
VOR b 建立 联系 。 因为 8 与 bub 与 < 有 直接 引文 关 
ANB a 与 6 没有 ,那么 a 与 就 有 潜在 合作 . 共 现 于 同 
-入 文章 的 可 能 。 本 文 称 引文 知识 关联 网 络 中 的 这 类 

> 


一 一 一 


mm 
( 跨 学 科 参 考 文献 
— 要 .关键 词 集合 R 5 


®© 
am 

mm 

E m 目标 学 科 文 献 
O 关键 词 集合 5 


a-b-c 结构 为 弱 关 系 结构 。 其 中 ,节点 b 是 使 a 与 e 通 
WHE AE ER“ ARR , 即 知识 媒介 ,在 跨 
学 科 引 文 网 络 中 ,知识 媒介 往往 是 学 科 交 叉 节 点 。 
2.2.1 知识 媒介 b 类 型 划分 

判断 目标 学 科 知 识 a 能 和 否 与 某 跨 学 科 相 关 知 识 c 
通过 弱 关 系 连 接 形成 知识 关联 ,首先 寻找 二 者 之 间 的 
知识 媒介 b 作为 “搭桥 者 ” 。 蜂 学 科 文 献 的 引用 与 被 
引用 ,本 质 上 是 将 来 自 不 同学 科 的 知识 基因 进行 自由 
组 合 ,形成 交叉 知识 进入 到 科学 知识 交流 系统 中 ,进而 
产生 不 同学 科 联 系 的 知识 链 、 知 识 网 ” 。 因 此 ,学 科 
交叉 关键 词 是 目标 学 科 知 识 与 跨 学 科 相 关 知 识 建立 弱 
连接 的 知识 媒介 。 示 意 如 图 4 所 示 : 


集合 3 


(SM RMD) 


图 4 知识 媒介 b 类 型 与 ab-c 弱 关 系 连接 路 径 


设 目标 学 科 文 献 关 键 词 集合 5、 其 跨 学 科 参 考 文 
献 关 键 词 集 R、 引 证 文献 关键 词 集合 D, 则 跨 学 科 知识 
弱 引 文 关 联网 络 G 是 由 S、R.D 集合 中 的 关键 词 ,基于 
引用 与 被 引用 建立 的 知识 关联 。 那 么 ,学 科 知 识 节 点 
a 用 关键 词 a, AN, A a, e $; 跨 学 科 相 关 知 识 c 用 关 
键 词 c; 表示 ,cs (RUD-S) ;知识 媒介 b, 用 关键 词 b， 
表示 ,b; e 集合 1U 集 合 2U 集 合 3, 其 中 集合 1(SNR- 
D) S84 2(SND-R) 集合 3(SmRmD) 表 示 网 络 G 中 


路 学 科 交 叉 研 究 关 键 词 。 

根据 知识 流向 ,知识 媒介 b; 细 分 为 3 种 类 型 :中流 
入 型 知识 媒介 by e 集合 1 , 跨 学 科 知 识 经 参考 文献 流 
入 目标 学 科 ;@ 流 出 型 知识 媒介 bs e 集合 2 ,目标 学 科 
通过 跨 学 科 引 证 文献 输出 知识 ;流动 型 知识 媒介 bs 
e 集合 3, 通 过 引用 与 被 引 在 学 科 之 间 传 递 知识 。 
2.2.2 ”基于 不 同 媒介 类 型 的 a-b-c 弱 关 系 流动 路 径 识 别 

以 学 科 知 识 证 点 a 为 例 , 其 基于 知识 媒介 biba 
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by ,可 分 别 与 跨 学 科 相关 知识 6 建立 连接 ,形成 ab-e 
弱 关 系 结构 。 图 4 中 , 单 向 箭头 表示 参考 或 引证 行为 ， 
即 知识 流入 或 流出 ;双向 箭头 表示 互 引 行为 ,知识 既 有 
流入 又 有 流出 。 则 共有 7 种 不 同 流动 形式 的 弱 连 接 路 
径 , 分 别 是 :OD 基于 “流入 型 "知识 媒介 ba 的 2 种 路 径 ; 
a,b,c, a;b, ecg; ORT FE E” ARRS ba 
的 2 种 路 径 :ai 一 baceca aiba >c; ORT A” 
知识 媒介 bs 的 3 AIRE 1a, by ey say by rey ae 
by ey. ABET AJN G 中 的 所 有 关系 ,抽取 所 
有 的 a-b-c 弱 关系 结构 。 
2.3” 跨 学 科 相关 知识 组 合 识别 模型 构建 

学 科 知 识 节点 a, 的 活跃 程度 .知识 媒介 bi 的 中 介 
能 力 . 节 点 之 间 的 联系 强度 ,都 是 分 析 a-b-c 弱 关 系 结 
Hha 与 潜在 合作 可 能 的 影响 性 因素 。 因 此 ,本 文 
分 网 定义 目标 学 科 知 识 节点 影响 力 指数 A, 、 知 识 媒介 
影响 力 指数 B, 跨 学 科 知识 相关 性 指数 C, 对 a-b-c 弱 
3 和 如 各 节点 的 特征 及 相关 性 进行 量化 描述 ;在 此 基础 
建 跨 学 科 相关 知识 组 合 潜在 合作 指数 了 模型 ,以 


科学 合理 地 识别 跨 学 科 相关 知识 组 合 。 


目标 学 科 知 识 节点 影响 力 指数 A， 
受热 点 浮现 效应 的 影响 ,知识 创新 更 易 在 呈 明 显 
SG 着 势 的 热点 主题 研究 过 程 中 产生 5” 。 因 此 ,研究 
热度 呈 明 显 上 升 趋势 的 学 科 知识 节点 ,活跃 度 高 ,更 有 
可 能 与 跨 学 科 知识 进行 合作 。 趋 势 分 析 法 是 一 种 经 典 
的 泛 量 预测 方法 ,其 原理 是 从 时 间 尺度 上 对 关键 词 在 
不 同时 间 点 出 现 的 频率 进行 回归 分 析 , 运 用 最 小 二 乘 
法 对 历史 数据 拟 合 直线 ,分 析 变 化 率 大 小 以 预测 其 未 
来 编 展 趋势 ,有 学 者 利用 这 一 算法 对 学 术 名 词 的 发 
展 趋势 进行 判定 !” 六 。 本 文 运用 趋势 分 析 法 定义 目 


息 ,激发 知识 创新 的 可 能 性 就 越 大 。 因 此 ,知识 媒介 的 
多 学 科 程 度 是 其 媒介 能 力 的 重要 体现 。 本 文 借鉴 A. 
L. Porter 等 '" 提出 的 论文 学 科 分 布 多 样 性 测度 指标 ， 
定义 知识 媒介 影响 力 指 数 B: 
F +F, +0 +F) ‘FY 
B=" Pakage ka =` - E Bi?) 

式 (2) 中 ,大 知识 媒介 b, 在 N 个 学 科 中 出 现 过 , 则 
F, 表示 第 n 个 学 科研 究 b, 的 学 术 论文 篇 数 , 即 F,、F， 
FY 之 和 为 b; 在 N 个 学 科 的 总 论文 篇 数 。 其 中 ,B, > 
1 , 值 越 大 ,表明 b, 跨 学 科 多 样 性 程度 越 高 ,影响 力 越 
大 ;当知 识 媒介 b, 只 在 一 个 学 科 的 文献 中 出 现 过 时 ,B， 
值 为 1。 
2.3.3 ” 跨 学 科 知 识 相关 性 指数 C 

该 指标 主要 测度 跨 学 科 相 关 知 识 c, 通过 知识 媒 
介 b, 与 学 科 知 识 节点 a, 建立 弱 关 系 连 接 的 强度 ,体现 
Sa Se, 的 相关 性 程度 。 令 AN a 与 b; 的 引用 /被 
引用 频次 ,IL. 为 b; 与 ci 的 引用 /被 引用 频次 , 则 节点 c; 
与 ai 的 相关 性 程度 ,与 II 呈正 相关 。 基 于 此 ,本 文 
根据 前 期 研究 文献 ”中 定义 的 联系 路 径 的 可 行 性 强 
E ,定义 跨 学 科 相 关 知 识 相 关 性 指数 C, ,计算 公式 为 : 

Lx 
ao RO 

为 使 式 (3) 有 意义 ,引进 B, 当 1 = 时 , 令 B=1， 
当 I*A}, S B=0。 
2.3.4” 跨 学 科 相 关 知 识 组 合 潜在 合作 指数 P 

17 世纪 ,牛顿 提出 的 万 有 引力 定律 是 测量 空间 相 
互 作用 的 一 种 方法 ,其 计算 公式 为 : 1 = 
KxM, xM, 


C, 


标 学 科 知 识 节 点 影响 力 指 数 A ,通过 判断 学 科 知识 节 
点 的 热度 变化 趋势 ,描述 其 在 学 科研 究 中 的 活跃 程度 ， 
公式 为 : 


A, 


Yx Ea xF) -Ea yx Sa F 
= 7 ae - SP 1 
Yx Eray (Ea) EG 

式 (1) 中 ,Y 值 表示 数据 样本 的 时 间 跨 度 ( 年 数 ) ， 

F, 为 关键 词 a 第 y 年 在 目标 学 科 的 研究 频次 。A 是 


D. , 式 中 表示 点 Sj 之 间 的 引力 大 小 ;Mi、 


Mj 分别 为 点 i 和 点 j 的 质量 ,di 为 i\j 之 间 的 最 短 距 
离 ,k 为 引力 系数 。 

在 跨 学 科 相 关 知 识 组 合 中 ,学科 知 识 节 点 a 通过 
知识 媒介 b; 与 跨 学 科 相 关 知 识 c; 产生 合作 可 能 性 的 
大 小 ,可 视 为 在 整个 引文 关联 网 络 中 a ve, 节点 引力 的 
大 小 , 受 学 科 关键 知识 节点 影响 力 指数 A、 知 识 媒介 


拟 合 直线 的 斜率 (变化 率 ) A A, >0, 说 明 该 关键 词 的 
研究 热度 为 上 升 发 展 趋势 ,上 且 A 值 越 大 ,变化 率 越 大 ， 
活跃 度 越 高 。 
2.3.2 知识 媒介 影响 力 指数 B, 

根据 弱 关系 理论 , 相 比 较 于 学 科 内 部 知识 , 跨 学 科 
知识 之 间 的 连接 较 难 建立 。 知 识 媒介 b, 作为 关键 搭 
桥 者 ,与 越 多 学 科 有 关联 ,就 越 能 接触 到 多 样 化 的 信 


影响 力 指 数 B, . 跨 学 科 知 识 相 关 性 指数 Ci 的 影响 。 

此 ,基于 引力 模型 定义 跨 学 科 相 关 知 识 组 合 潜在 合作 

HAU P, HARD: 

Yx Eal xF) -ayx Ea E, 
Yx Dar = yy) 

有 ( 2 F,)° 有 (La xI)? 

bee oe 17 -Lel +6 


P=A,xB,xC,= 


式 (4) 
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3 ”实证 分 析 一 一 情报 学 跨 学 科 相 关 知 识 


组 合 识别 


3.1 ”数据 来 源 与 预 处 理 

本 文选 择 CSSCI 来 源 期 刊 中 9 种 情报 学 期 刊 刊 载 
的 论文 作为 实证 样本 进行 研究 ,验证 基于 弱 引 文 关系 
跨 学 科 知识 合作 组 合 识别 方法 的 可 行 性 与 有 效 性 。9 
种 期 刊 包括 :《 情 报 学 报 》《 情 报 资料 工作 》《 图 书 情报 
工作 》《 情 报 理 论 与 实践 )《 图 书 情报 知识 )《 图 书 与 情 
报 》《 情 报 科 学 》《 数 据 分 析 与 知识 发 现 )《 情 报 杂志 》。 
时 间 跨 度 为 2015 -2019 年 。 

(1) 源 文献 数据 下 载 。 利 用 CNKI 数据 库 ,通过 专 
业 检 索 功 能 ,检索 上 述 9 种 期 刊 5 年 间 刊载 的 有 效 文 
FRE 18 052 篇 ,下载 含 标题 .关键 词 摘要 出 版 时 间 等 
学 眉 的 题 录 信 息 ,批量 下 载 为 test 文本 格式 ,并 导入 
MySQL 关系 型 数据 库 中 存储 。 
(2) 参考/ 引证 文献 数据 获取 。 运 用 编码 的 Python 
脸型 程序 ,获取 18 052 篇 论文 的 参考 文献 和 引证 文献 
的 三 录 数 据 ,包括 标题 ,关键 词 .摘要 、 出 版 时 间 、 刊 名 
A 
之 (3 ) 跨 学 科 参 考 / 引 证 文献 匹配 与 预 处 理 。 根 据 
《各 国 科技 期 刊 引证 报告 》 中 对 期 刊 - 学科 的 分 类 ,用 
文献 ”的 方法 , 读 取 题 录 数 据 中 的 “ 刊 名 "字段 信息 ， 
兰 丐 配 判 断 文 献 的 学 科 归 属 。 去 除 文献 引用 格式 错 
误 G 砍 失 等 无 效 文献 和 英文 文献 ,筛选 来 自 跨 学 科 中 文 
期 到 的 参考 和 引证 文献 数据 ,结果 同样 下 载 为 test 文 
AMEIR, TA MySQL 中 ,并 分 别 对 应 其 目标 学 科 数 据 
信息 。 最 终 得 45 086 篇 跨 学 科 参 考 文献 和 40 103 篇 
跨 学 科 引 证 文献 。 
3.2 构建 情报 学 跨 学 科 知 识 弱 引 文 关 联网 络 

根据 2. 1 的 方法 描述 ,对 经 过 预 处 理 的 样本 数据 ， 
构建 情报 学 科 文献 关键 词 — 跨 学 科 参 考 文献 关键 词 - 
跨 学 科 引 证 文献 关键 词 的 知识 关联 网 络 ,操作 步骤 如 
下 : 

(1) 提取 关键 词 。 因 为 论文 自 带 关键 词 数 量 有 
限 , 不 能 很 好 地 反映 全 文 内 容 , 本 文 抽取 MySQL 数据 
库 中 存储 的 目标 学 科 文献 及 其 对 应 的 跨 学 科 参 考 和 引 
证 文献 “标题 "和 “摘要 ”字段 的 数据 ,构成 语料库 。 利 
用 MySQL 关系 型 数据 库 中 的 “text mining” 选 项 ,编写 
Python 语言 工具 ,应 用 Jieba 分 词 包 ,将 中 国 规范 术语 
数据 库 提供 的 各 学 科 规范 关键 词 作 为 分 词 词典 ,对 语 
料 库 进行 中 文 分 词 .去 停 用 词 . 词 频 统计 合并 同义词 、 


统一 规范 化 等 处 理 ,不 考虑 频次 ,只 要 出 现 就 保存 ,得 
到 代表 每 篇 文献 核心 知识 点 的 关键 词 ,并 将 抽取 到 的 
关键 词 对 应 其 所 属 的 文献 保存 。 经 过 最 终 处 理 ,得 到 
21 023 个 情报 学 科 关 键 词 的 集合 S52 805 个 跨 学 科 参 
考 文 献 关 键 词 的 集合 R、51 917 个 跨 学 科 引 证 文献 关 
键 词 的 集合 D。 

(2) 构 建 引文 关系 网 络 。 利 用 MySQL 中 的 关系 型 
规则 匹配 方法 ,将 基于 文献 的 引文 关系 转换 为 所 包含 
关键 词 之 间 的 引证 关系 。 同 时 ,编写 Python 程序 ,遍历 
S、R.D 集合 中 的 所 有 关键 词 及 其 引证 关系 ,构建 基于 
关键 词 的 跨 学 科 知识 引文 关系 网 络 C。 该 网 络 是 有 癌 
加 权 网 络 ,反映 关键 词 之 间 的 引证 关系 ,方向 表示 引用 
或 被 引用 ,权重 代表 两 者 引用 /被 引用 行为 产生 的 连接 
3.3 识别 情报 学 跨 学 科 引 文 网 络 中 的 a-b-c 弱 关 系 结 
构 


依据 2.2 方法 论述 ,在 情报 学 跨 学 科 引 文 关 系 网 
络 G 中 ,识别 知识 媒介 b 和 a-b-c 弱 关 系 结构 ,方法 与 
步骤 如 下 : 

(1) 知 识 媒介 b 识别 。 学 科 交 叉 研 究 关键 词 是 a- 
b-c 弱 关 系 结构 建立 的 重要 知识 媒介 ,因此 首先 需 提取 
学 科 交 义 研 究 关键 词 。 如 图 4 所 示 ,对 集合 SRG R, 
集合 D 中 的 关键 词 进行 共 现 分 析 , 得 到 3 部 分 交叉 研 
究 关 键 词 ,集合 1 中 有 4 817 个 流入 型 知识 媒介 、 集 合 
2 中 2 805 个 流出 型 知识 媒介 、 集 合 3 中 218 个 流动 型 
知识 媒介 。 

(2)a-b-c 弱 关 系 结构 识别 。 以 S 集合 中 情报 学 的 
每 一 个 关键 词 为 起 点 ,利用 Apriori 关联 游 走 算法 , 编 
写 Python 程序 ,遍历 MySQL 数据 库 及 其 所 有 的 关联 数 
据 , 寻 找 S 集 合 中 的 学 科 知 识 节 点 a 在 网 络 G 中 的 知 
识 媒介 b 7 种 不 同 连接 路 径 的 所 有 跨 学 科 相 关 知 识 c， 
ER a 与 c 的 直接 引用 与 被 引用 关系 ,最 终 仅 得 到 657 
条 a-b-c 弱 关 系 结构 。 
3.4 情报 学 跨 学 科 相 关 知 识 组 合 指数 计算 与 识别 

(1) 相关 指数 计算 。 对 表征 情报 学 科 知 识 节 点 的 
所 有 关键 词 a ,抽取 MySQL 数据 库 中 存储 记录 的 “出 版 
时 间 ” 字 段 信息 ,统计 该 关键 词 在 2015 - 2019 年 内 每 
一 年 的 出 现 频数 ,应 用 公式 (1) ,计算 知识 节点 影响 力 
指数 Ai ,计算 结果 见 表 1 第 6 列 ; 对 表征 知识 媒介 上 的 
所 有 关键 词 ,利用 MySQL 数据 库 获取 其 所 属 的 全 部 文 
献 记录 ,根据 期 刊 - 学 科 分 类 来 确定 关键 词 分 布 在 哪 
些 学 科 ,并 分 别 统计 于 每 一 个 学 科 的 分 布 篇 数 , 应 用 公 
式 (2) ,得 知识 媒介 影响 力 指数 B, ,计算 结果 见 表 1 第 
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7 列 ; 利 用 自 编 的 Python 程序 ,遍历 网 络 C ,得 每 一 条 
a-b-c IKRP b 与 ab 节点 的 连接 次 数 ,应 用 公 
AG) ,计算 跨 学 科 知 识 相关 性 指数 C1, 见 表 1 第 8 列 ; 
最 后 ,应 用 公式 (4) ,计算 每 一 条 a-b-c 弱 连 接 的 a 与 c 
潜在 合作 指数 了 , 见 表 1 第 9 列 。 


(2) 跨 学 科 相 关 知 识 组 合 识别 结果 。 按 照 跨 学 科 
相关 知识 a 与 c 潜在 合作 指数 了 值 由 高 到 低 顺 序 排 
列 ,选择 排名 前 10 位 的 结果 展示 ,相关 数据 如 表 1 所 
示 : 


表 1 情报 学 科 跨 学 科 相 关 知识 组 合 识 别 结果 相关 数据 ( 部 分 ) 


排名 目标 学 科 知识 节点 a ”知识 媒介 b 跨 学 科 相 关 知 识 。 ”流动 路 径 Es yeas oo wis 

1 科研 合作 知识 流动 种 群 动力 学 模型 aob 2.60 2.73 5.33 37.35 

2 引文 网 络 多 元 数据 融合 有 限 元 分 析 法 abec 2.50 2.34 6.25 35.85 

3 跨 学 科 链 路 预测 随机 森林 算法 abec 2.60 1.99 6.25 32.48 

4 高 被 引文 献 复杂 网 络 羊 群 效应 abec 2.70 2.83 4.00 30. 87 

5 智库 大 数据 MongoDB 数据 库 abe 2.30 3.24 4.00 29. 82 

6 Altmetrics 放 存 取 信息 网 络 传播 权 atob—e 3.10 2.08 4.50 29.25 

q 知识 图 谱 关联 规则 多 标签 学 习 abec 2.00 2.17 6.25 26.77 

> 网 络 盘 情 实体 相似 度 信息 草 房 athe 2.50 2.09 4.00 20. 60 

CD MANH 超 弦 理论 超 弦 引力 模型 ache 2.40 1.68 4.50 18.37 

EA 社交 媒体 人 际 情报 网 络 概念 格 a bec 2.30 1.73 4.00 16.02 
Pacer 结果 分 析 点 , 横 跨 信息 科学 .社会 科学 .数学 .教育 学 ,心理 学 A 
O = 济 学 等 诸多 学 科 领 域 ,表现 出 典型 的 跨 学 科 性 , 


= 
40N 识别 结果 有 效 性 分 析 


aQ 目标 学 科 知 识 节点 影响 力 指数 A, 可 有 效 识别 


二 表 1 中 ,第 2 列 数据 是 表征 目标 学 科 知识 节点 a 
的 关键 词 , 其 中 “Altmetrics”"“ 智 库 "“ 科 研 合作 ”“ 跨 学 
PEENISE 6 列 影响 力 指数 A, 值 相对 较 高 ,说 明 情报 
学 释 2015 - 2019 年 间 这 些 关键 词 的 研究 文献 呈 逐 年 
增 锋 的 趋势 ,是 学 科研 究 热点 。 这 些 结 果 恰恰 是 广 
献 ”识别 得 到 的 情报 学 领域 发 展 趋势 为 “上 升 类 ” 研 
究 热 点 的 一 部 分 。“ 睡 美人 文献 “高 被 引文 献 "等 也 
是 近年 情报 学 中 研究 热度 与 关注 度 持续 增长 的 关键 
词 “”。 这 说 明 , 基 于 趋势 分 析 法 的 A, 指数 用 于 分 
析 上 升 趋势 的 研究 热点 是 可 行 有 效 的 ,识别 结果 有 更 
大 可 能 引入 其 他 学 科 的 相关 概念 .理论 .方法 和 技术 等 
跨 学 科 相关 知识 实现 跨 学 科 合作 。 

4.1.2 ”知识 媒介 影响 力 指数 B, 可 识别 跨 学 科 性 强 的 
搭桥 者 

观察 表 1 第 3 列 和 第 7 列 数据 “大 数据 "的 知识 
媒介 影响 力 指数 B, 为 3 24 ,数值 最 高 。 表 明 其 跨 学 科 
性 明显 ,涉及 学 科 领 域 多 样 ,相关 知识 广泛 ,具有 较 高 
的 媒介 能 力 , 成 为 促进 不 同学 科 间 知识 交流 与 融合 的 
有 力 “ 搭 桥 者 ”"。 同 时 ,研究 表明 :大 数据 作为 信息 社 
会 纵深 发 展 的 产物 ,其 研究 已 经 成 为 科技 界 的 研究 热 


这 与 本 文 的 研究 结论 存在 一 致 性 。 因 此 ,知识 媒介 影 
响 力 指数 B, 可 用 来 计算 关键 词 的 跨 学 科 性 ,识别 媒介 
能 力 强 的 “搭桥 者 ”。 
4.1.3 跨 学 科 知 识 相关 性 指数 Ci 能 有 效 识别 与 目标 
学 科 相 关 性 高 的 跨 学 科 知 识 

表 1 中 ,第 4 列 和 第 8 列 数据 ,关键 词 有限 元 分 
析 法 ”随机 森林 算法 “多 标签 学 习 “种群 动 力学 模 
型 "等 的 跨 学 科 知 识 相关 性 指数 C, 值 较 高 ,说明 它们 
分 别 基于 知识 媒介 "多 元 数据 融合 “ 链 路 预测 “关联 
规则 ”知识 流动 "作为 搭桥 者 ”, 与 情报 学 科 的 “引文 
网 络 "“ 蜂 学 科 ”“ 知 识 图 谱 ”“ 科 研 合作 ”等 关联 度 高 。 
例如 ,引文 网 络 - 多 元 数据 融合 -有 限 元 分 析 法 ,流动 
BYE ac—be—e , “引文 网 络 ” 引 用 “多 元 数据 融合 ” 频 
次 高 ， 多 元 数据 融合 " 引用“ 有限 元 分 析 法 " 频 索 ,说 
明 “ 有 限 元 分 析 法 ”可 以 用 于 “引文 网 络 ”的 研究 。 文 
献 分 析 发 现 , 二 者 有 一 定 的 关联 性 , 见 4.2 的 分 析 结 
论 。 因 此 ,相关 性 指数 Ci 可 以 有 效 识别 与 目标 学 科 相 
关 性 高 的 跨 学 科 知识 。 
4.1.4 ”潜在 合作 指数 了 能 有 效 结合 a-b-c 弱 连 接 中 
目标 学 科 知 识 节 点 a 的 活跃 度 、 知 识 媒 介 b 的 跨 学 科 
性 、 跨 学 科 相 关 知 识 ¢ 的 相关 性 特征 ,识别 具有 高 合作 
潜力 的 跨 学 科 相 关 知 识 组 合 

表 1 中 ,观察 第 9 列 潜在 合作 指数 P 值 排名 第 一 
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位 的 “科研 合作 -知识 流动 - 种 群 动力 学 模型 "a-b-c 
弱 关 系 的 相关 数据 ,其 中 A, 值 为 2.60, BI 值 为 2.73， 
CI 值 为 5.33 ,分 别 位 居 第 4 位 第 3 位 .第 2 位 ,虽然 目 
标 学 科 知识 节点 活路 度 ,知识 媒介 多 样 性 程度 、 跨 学 科 
知识 相关 性 不 是 最 高 ,但 都 比较 高 ,所 以 “科研 合作 ” 
与 “种 群 动力 学 模型 "的 吸引 力 最 强 ,之 间 有 比较 密切 
的 潜在 联系 , 弱 关 系 连接 的 潜力 值 最 大 ,为 37.35 ,成 为 
合作 潜力 最 高 的 跨 学 科 相 关 知 识 组 合 。 因 此 ,潜在 合 
作 指数 了 能 有 效 结合 a-b-e 弱 关 系 中 各 节点 的 属性 及 
相互 关系 ,识别 具有 高 合作 潜力 的 跨 学 科 相关 知识 组 
pan 
4.2 识别 结果 应 用 分 析 

表 1 为 识别 得 到 合作 潜力 值 高 的 跨 学 科 相 关 知 识 
纺 合 。 为 探讨 识别 结果 的 有 效 性 ,分 析 跨 学 科 相关 知 
识 解 决 情报 学 问题 的 技术 方案 ,促进 跨 学 科 合作 研究 
创新 ,对 排名 前 两 位 的 结果 进行 应 用 分 析 : 


型 号 “科研 合作 ”可 以 使 不 同 的 知识 实现 集成 ,使 不 
同 逢 识 背景 的 研究 人 员 、 组 织 或 机 构 之 间 进 行 知识 的 
硼 王 ,是 加 速 知识 扩散 的 重要 方式 之 一 ” 。 从 科研 合 
从 答 度 出 发 ,合作 双方 基于 知识 势能 差 获取 互补 性 知 
设 给 源 实现 知识 流动 。“ 知 识 流动 "过 程 推动 知识 传 
OTE MORUS JERAS A A 
动 放 学 模型 "是 一 种 研究 种 群 间 以 及 种 群 与 不 确定 性 
政 考 间 相 互 作用 的 行为 动力 学 模型 ""。 知 识 流动 与 
种 群 移动 有 一 定 的 知识 关联 ,知识 流动 又 嵌入 在 科研 
合作 过 程 中 。 因 此 ,可 尝试 将 种 群 动力 学 模型 代入 科 
研 钙 作 过 程 ,模拟 分 析 该 过 程 中 知识 扩散 模式 .知识 融 
合 的 演化 路 径 等 ,挖掘 科研 合作 中 主体 合作 模式 ,关系 
结构 .地 位 变化 等 特征 ,以 揭示 科研 合作 发 展 的 潜在 规 
律 。 

(2) “引文 网 络 "“ 多 元 数据 融合 ”"“ 有 限 元 分 
析 法 ”"。“ 引 文 网 络 "是 由 研究 文献 构成 的 大 规模 知识 
网 络 ,包含 了 大 量 的 引用 关系 和 文本 属性 等 多 元 数据 。 
“多 元 数据 融合 "是 指 利用 数据 融合 算法 高 效 整合 多 
种 关联 数据 ,从 而 通过 更 丰富 的 信息 抽取 与 识别 ,获得 
更 加 准确 的 知识 单元 之 间 的 潜在 语义 关系 。“ 有 限 
元 分 析 法 "将 求解 域 看 成 是 由 许多 称 为 有 限 元 的 小 的 
互 连 子 域 组 成 ,对 每 一 单元 假定 一 个 合适 的 近似 解 , 然 
后 推导 求解 这 个 域 总 的 满足 条 件 ,从 而 得 到 问题 的 
解 ” 。 引 文 网 络 中 存在 各 种 各 样 的 复杂 网 络 ,按照 有 
限 元 分 析 法 的 思想 ,可 将 这 些 复杂 网 络 分 解 为 多 个 简 
单 的 子 网 络 , 对 每 个 子 网 络 中 的 多 元 数据 进行 有 效 融 


合 , 用 较 简 单 的 问题 代替 复杂 问题 ,继而 模拟 得 到 实现 
多 元 数据 融合 的 整体 网 络 。 因 此 ,可 以 尝试 应 用 有 限 
元 分 析 法 ,融合 引文 网 络 中 的 多 元 数据 ,提高 引文 网 络 
数据 挖掘 和 知识 发 现 的 效率 。 


5 结语 


本 文 基于 弱 引 文 关 系 提 出 跨 学 科 相 关 知 识 组合 发 
现 方法 。 首 先 ,构建 基于 关键 词 的 跨 学 科 知 识 弱 引文 
关联 网 络 ;其 次 ,识别 引文 网 络 中 a-b-e 弱 关系 结构 , 定 
义学 科 关 键 知识 节点 影响 力 指数 A、 知 识 媒介 影响 力 
Ha Bl、 跨 学 科 知 识 相 关 性 指数 Ci ,构建 合作 洪 力 指 
数 P 模 型 。 最 后 ,选择 情报 学 领域 9 种 优秀 期 刊 2015 
-2019 年 的 载 文 及 其 跨 学 科 参 考 / 引 证 文献 为 样本 进 
行 实证 研究 。 对 识别 结果 进行 有 效 性 分 析 , 发 现 本 文 
提出 的 路 学 科 相关 知 识 组 合 发 现 方法 具有 合理 性 和 有 
效 性 ;同时 ,探讨 识别 结果 的 应 用 前 景 ,发 现 基于 该 方 
法 的 识别 结果 具有 一 定 的 跨 学 科 合 作 意 义 。 

本 研究 的 实证 样本 来 源 于 情报 学 科 的 中 文 文献 。 
一 方面 ,该 方法 是 否 适用 于 其 他 学 科 或 其 他 语种 文献 ， 
有 待 于 进一步 验证 ; 另 一 方面 ,网 络 社交 媒体 等 非 正式 
学 术 交 流 方式 的 发 展 ,也 为 跨 学 科 知 识 的 交流 与 合作 
提供 了 研究 视角 与 数据 来 源 。 因 此 ,未 来 研究 可 利用 
跨 语言 文献 及 网 络 社交 媒体 数据 进一步 对 跨 学 科 相 关 
知识 组 合 的 识别 工作 展开 研究 ,以 得 到 更 深入 、 全 面 的 
结论 ,从 而 进一步 促进 学 科 间 知识 的 交流 合作 ,推动 知 
识 创新 。 
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Discussion on the Method of Interdisciplinary Related Knowledge Combination Identification 
on the Perspective of Weak Citation Relationship 
—Taking Information Science for Example 
Pai Yanxin Li Changling Xu Lu 
Science and Technology Information Research Institute ,Shandong University of Technology, Zibo 255049 

Abstract: | Purpose/significance | With the complexity of the scientific system, interdisciplinary research has 
become an important paradigm and inevitable trend of modern scientific innovation research. Identifying interdiscipli- 
nary relevant knowledge combination that has high cooperation potential, becomes the key to promoting interdiscipli- 
nary scientific research cooperation and innovation. | Method/process | Firstly, the paper selected target subject 
source literature ,its interdisciplinary reference literature , and its interdisciplinary citing literature, so as to construct 
an interdisciplinary knowledge weak reference relational network based on keywords. Secondly, it classified the types 
of Knowledge Medium b, and identified the weak relational structure of the Knowledge Node a of the target discipline- 
nowledge Medium b - Interdisciplinary Knowledge c. Finally, the paper defined the Knowledge Node Influence In- 
Alex AI of the target discipline, the Knowledge Media Influence Index BI, the Interdisciplinary Knowledge Correlation 
dex CI, the Interdisciplinary Knowledge Combination a-c and Potential Cooperation Index P, to identify the inter- 
ciplinary knowledge combination with high cooperation potential. | Result/conclusion | The papers of 9 CSSCI 
qoymnals in the field of informatics from 2015 to 2019 and their interdisciplinary references and citations were selected 
xaş samples for empirical research, to verify the effectiveness and feasibility of the discovery method of interdiscipli- 
Gary knowledge combination based on weak citation relationship, and to identify the interdisciplinary knowledge com- 
ation with high cooperation potential of intelligence disciplines such as “scientific research cooperation” — “ knowl- 

Cede flow” - “population dynamics model” . 
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